301 research outputs found

    Automatic assignment of biomedical categories: toward a generic approach

    Get PDF
    Motivation: We report on the development of a generic text categorization system designed to automatically assign biomedical categories to any input text. Unlike usual automatic text categorization systems, which rely on data-intensive models extracted from large sets of training data, our categorizer is largely data-independent. Methods: In order to evaluate the robustness of our approach we test the system on two different biomedical terminologies: the Medical Subject Headings (MeSH) and the Gene Ontology (GO). Our lightweight categorizer, based on two ranking modules, combines a pattern matcher and a vector space retrieval engine, and uses both stems and linguistically-motivated indexing units. Results and Conclusion: Results show the effectiveness of phrase indexing for both GO and MeSH categorization, but we observe the categorization power of the tool depends on the controlled vocabulary: precision at high ranks ranges from above 90% for MeSH to <20% for GO, establishing a new baseline for categorizers based on retrieval methods. Contact: [email protected]

    Politique documentaire de la bibliothèque de l’ECAL: étude et élaboration

    Get PDF
    Ce travail de Bachelor a pour objectif l’étude et la réalisation d’une politique documentaire pour la bibliothèque de l’ECAL à Renens. Cette bibliothèque spécialisée en art contemporain et design s’adresse en particulier au public estudiantin de l’école. En tenant compte du foisonnement éditorial, des évènements incontournables dans le milieu artistique et de l’abondance informationnelle, elle doit proposer une offre documentaire à la fois ciblée et pertinente. Pour une gestion optimale de ses collections et afin de mieux répondre aux besoins et attentes de ses usagers, la bibliothèque souhaite sortir de l’informel et assurer une certaine pérennité de ses pratiques grâce à une politique documentaire formalisée. Le présent travail s’articule en trois principales étapes. La première présente les politiques documentaires de manière générale, souligne les particularités et les difficultés inhérentes aux domaines de l’art contemporain et du design et enfin s’intéresse aux pratiques dans des institutions similaires à l’ECAL. La deuxième étape décrit plus particulièrement l’ECAL et sa bibliothèque en mettant l’accent sur les missions, les publics et les collections de celle-ci. Pour finir, la troisième étape dévoile l’aboutissement de ce travail, à savoir l’élaboration de la politique documentaire, de fiches de sélection spécifiques pour chaque grand domaine de la bibliothèque et d’un calendrier des principaux évènements en art contemporain et design. La politique documentaire, bien qu’étant un outil nécessaire, n’est pas indispensable pour le bon fonctionnement d’une bibliothèque. Nombreuses sont les bibliothèques qui n’en possèdent pas, les étapes pour sa conceptualisation nécessitent du temps et de dégager des ressources à la fois humaines et financières. Pourtant, les bibliothèques prennent de plus en plus conscience des bénéfices d’un tel outil et se lancent dans sa réalisatio

    Les fonds patrimoniaux de la Section genevoise du Club Alpin Suisse: une collection à évaluer, réorganiser, préserver et valoriser

    Get PDF
    Ce travail est le résultat d’un mandat donné par la Section genevoise du Club Alpin Suisse (C.A.S.), qui souhaite avoir une meilleure vision de son fonds documentaire, dont la connaissance s’est perdue au fil des ans. Il n’est que l’un des mandats d’une série de travaux réalisés sur différentes parties de la collection, et se concentre essentiellement sur les fonds spéciaux, c’est à dire les documents rangés dans la partie inférieure des meubles de la bibliothèque de la Section. Ces documents constituent une collection hétérogène par sa typologie : périodiques, monographies, cartes et panoramas, documents d’archives et manuscrits. Un premier inventaire a permis de déterminer que presque tous concernent la montagne et qu’une moitié d’entre eux sont des productions documentaires du C.A.S., qu’il s’agisse de la Section genevoise ou d’autres sections. En examinant leur accessibilité dans d’autres bibliothèques et centres de documentation suisse, ainsi que de leur proximité avec la Section, ce travail conclut quelle fonds possède une réelle valeur patrimoniale, pour la Section même et pour l’alpinisme genevois dans son ensemble. Plusieurs solutions de valorisation sont proposées. La collection dans son ensemble, c’est à dire les fonds spéciaux examinés ici et les divers autres fonds possédés par la Section, pourrait être versée à un partenaire externe qui se chargerait alors de sa!mise en valeur. Plusieurs partenaires possibles sont proposés, dont le plus approprié serait la! Bibliothèque de Genève (BGE), qui a pour mission d’assurer la sauvegarde du patrimoine genevois. Alternativement, la Section peut décider de gérer elle-même sa collection. Dans ce cas, il est nécessaire de protéger les documents plus fragiles en les conditionnant de manière appropriée, puis de réaliser un inventaire détaillé de l’ensemble de la collection en y incluant les parties non couvertes par le présent travail. La communication de cet inventaire permettra alors de présenter le fonds documentaire tout entier et de faire apparaître sa réelle valeur. Certains documents individuels pourraient être exploités par des chercheurs, en particulier dans le domaine des sciences humaines

    Merchandising et mise en place des collections en bibliothèques de lecture publique

    Get PDF
    L’application des techniques de marketing à la gestion des bibliothèques est très débattue. En revanche, l’application spécifique des techniques de merchandising est une pratique nettement moins évoquée. Le merchandising est une sous-discipline du marketing qui s’occupe de l’allocation des emplacements et de la présentation des produits sur le point de vente. En bibliothèque, il s’agit donc de développer une démarche marketing pour la mise en espace des documents. Dans ce travail, les principes du merchandising sont transposés pour une application en bibliothèque de lecture publique. Les bibliothèques génèrent une grande quantité de données de circulation et de description des documents : ce travail explore aussi comment ces données de grande qualité peuvent être exploitées et valorisées dans une démarche de merchandising.The application of marketing methods for libray management is a much debated question. On the other hand, the specific application of merchandising methods is less debated. Merchandising is a component of marketing whose concern is the in-store allocation of space for products and their presentation. Hence for public libraries, the idea is to apply a marketing approach specifically centered on space utilization for documents. In this paper, merchandising principles are adaptated for an application in public libraries. Libraries create a lot of circulation datas and document description datas : this paper explores as well how those high quality datas can be used and how they can create value in the perspective of a merchandising approach

    Capturer et diffuser l'éphémère des prestations musicales: une étude pour la systématisation des enregistrements audiovisuels de la Haute école de musique, du Conservatoire de Lausanne et de l'Ecole de jazz et de musique actuelle

    Get PDF
    La musique est un art de l’instantanéité : à un moment et à un lieu précis, un artiste fait partager à des auditeurs une prestation musicale. Avec les enregistrements audiovisuels, il est possible d’immortaliser cette performance. Même si ces enregistrements paraissent particulièrement intéressants pour les usages présents et futurs, leur utilisation, transmission et gestion ne sont pas encore ancrées dans les pratiques des écoles de musique. Ainsi, en prenant comme objet d’étude l’environnement de la Haute École de Musique et du Conservatoire de Lausanne (HEMU-CL) ainsi que de l’École de Jazz et de Musique Actuelle (EJMA), ce travail mène une réflexion sur différents aspects qui permettront de systématiser la capture des événements et d’améliorer la gestion et l’accès des enregistrements : une analyse interne, une analyse externe et une analyse des besoins. Ces différentes étapes ont été nourries par des informations récoltées au travers de recherches bibliographiques et documentaires et grâce à des entretiens et des sondages. Tout d’abord, l’analyse interne des institutions permet d’avoir une vision plus claire du chemin que parcourent les événements musicaux au sein des institutions, de la capture à la diffusion. Ensuite, l’analyse externe donne des informations sur la situation dans d’autres écoles de musique en Suisse, en Allemagne, en Angleterre et en France. Ces deux premières étapes sont mises en regard pour pouvoir situer la HEMU-CL et l’EJMA par rapport aux autres institutions. Enfin, l’analyse des besoins des étudiants et professeurs de ces deux entités apporte des éléments pertinents concernant leur opinion et besoins vis-à-vis des enregistrements audiovisuels, que ce soit en terme de types d’événements à enregistrer et d’accès préférentiel. Pour finir, cette étude propose une série de recommandations, basées sur une revue de la littérature et sur les analyses menées. Elles concernent notamment l’importance des métadonnées, la question du stockage, de l’accès interne et externe à la collection. Enfin, nous avons formulé des propositions pour la systématisation du processus

    Définition d'une méthode de suivi des coûts de la publication en Open Access pour l'Université de Genève

    Get PDF
    Ce travail, réalisé sur mandat de la Division de l’Information Scientifique de l’Université de Genève, se penche sur les problématiques de suivi des coûts de la publication sur revues en Open Access, pour proposer un modèle adapté aux besoins de l’institution. Dans la première partie du travail, l’étude de la littérature dresse un cadre des suivis mis en place au niveau national au Royaume-Uni et aux Pays-Bas. Ensuite, les exigences du Fonds National Suisse et les travaux en cours sur le sujet sont pris en considération. Un état des lieux de l’Université de Genève constitue la deuxième partie. Après une analyse des réponses de l’université au questionnaire du FNS sur le sujet, qui a mis en évidence les données non disponibles ou lacunaires, des entretiens avec certains services de l’université ont permis d’évaluer différentes alternatives pour le cadre de récolte. Parallèlement, une série d’entretiens dans les facultés et une analyse des publications ont permis, d’un côté, de dresser un panorama des pratiques de publication en Open Access des facultés, et de l’autre, d’évaluer la problématique de l’exhaustivité et de l’exactitude des données, pour proposer la méthode de collecte la plus efficace. Les recommandations proposent une modélisation conceptuelle des données et deux cadres alternatifs de récolte, ainsi qu’une liste des champs concernés. L’étude conclut que la collecte des données, pour être efficace, devra être soutenue par des politiques institutionnelles et facultaires, qui en garantissent la systématicité

    Les archives de la bande dessinée: éléments d'analyse pour la mise en place d'une démarche d'acquisition de fonds d'archives de la bande dessinée par le Centre BD de la Ville de Lausanne

    Get PDF
    Ce mémoire est le résultat d'un travail de Master concernant les archives de la bande dessinée. Le sujet est abordé ici dans le contexte du Centre BD de la Ville de Lausanne, qui met en place une démarche d'acquisition de fonds d'archives pour documenter le secteur d'activité lié à la bande dessinée en Suisse. Sur quels concepts d'évaluation et de sélection fonder une démarche d'acquisition des archives de la bande dessinée ? Que peut apporter l'approche archivistique dans la constitution du patrimoine documentaire de la bande dessinée ? Comment un projet patrimonial pour la bande dessinée prend place dans un environnement institutionnel, politique et culturel ? Comment intégrer les acteurs de la bande dessinée et du patrimoine dans ce processus ? Telles sont les questions qui se posent quand on aborde le sujet de la prise en charge institutionnelle des archives produites par le secteur de la bande dessinée. La littérature secondaire sur l'acquisition des fonds d'archives d'origine privée montre que des principes d'acquisition peuvent être définis à travers une politique et une méthode proactive d'acquisition, des outils conceptuels qui permettent de structurer la démarche. Mais c'est surtout de la mise en perspective des questions évoquées avec la situation actuelle du projet d'archivage que l'on peut déduire des principes d'acquisition adaptés aux archives de la bande dessinée et qui tiennent compte du contexte du Centre BD de Lausanne. Ce travail propose donc un état des lieux de ces différents aspects. Après avoir abordé la question de l'acquisition sous l'angle théorique, il propose d'observer comment est constitué le patrimoine documentaire de la bande dessinée à travers les initiatives de différentes institutions en Suisse et en Europe et comment y sont abordées les archives. Il étudie également la situation du Centre BD et l'inscription du projet d'archivage dans son environnement stratégique et fonctionnel. Enfin, il procède à une prospection des producteurs et utilisateurs des archives de la bande dessinée qui met en évidence certaines caractéristiques de ces archives et des besoins qui s'y rapportent de la part des uns et des autres. Ce travail aboutit sur une discussion et des propositions concernant les principes et la méthode d'acquisition à mettre en oeuvre à partir de ces différentes analyses

    Ouverture sur un thème de gestion documentaire: classement, délais de conservation et évaluation de documents du Conservatoire de l'ouest vaudois, contexte législatif et réglementaire

    Get PDF
    Le Conservatoire de l’ouest vaudois (COV) mène des activités centrées sur la musique classique dans une région du Canton de Vaud qui s’étend de Nyon à St-Sulpice. Il accueille des élèves non professionnels. Sur demande du directeur du COV, cette étude propose des améliorations en matière de gestion des documents de l’institution, lesquels témoignent de l’importance des écoles de musique au plan culturel et sociétal. Travail de gestion de l’information, ce mémoire part d’un solide ancrage dans des références théoriques et méthodologiques. Il commence par une analyse fine du contexte, des besoins et des contraintes, se poursuit par la réalisation de trois objectifs et aboutit à des outils d’aide à l’amélioration de la gestion documentaire. Les deux premiers objectifs se focalisent sur les documents ayant trait à l’organisation des cours. L’un est consacré à leur classement et le suivant à leur calendrier de conservation. Pour le personnel du COV, la gestion des documents se résume en trois étapes : les classer, les administrer (les garder pour la durée fixée) et les trier (les éliminer ou les conserver comme archives historiques). Nous avons donc créé un outil désigné par un acronyme dont la couleur des trois dernières lettres souligne la structure (OuCAT) : un outil servant à classadministrier les documents. Notre invitation au personnel du COV : « Look in l’OuCAT ! ». Le troisième objectif de ce travail consiste à proposer des critères de sélection des documents relatifs aux manifestations (concerts, spectacles, etc.) : les garder comme mémoire documentaire du COV ou les éliminer. Cette partie de notre étude débouche sur l’OuT, acronyme d’outil de tri : un répertoire de 27 critères d’évaluation illustrés par des exemples tirés des fonds étudiés. Notre solution en bref : « Look in l’OuT ! » Le contexte législatif et réglementaire vaudois en matière de gestion documentaire fait aussi l’objet d’une analyse, qui permet au COV de connaître les principaux enjeux conjugués de la loi sur l’archivage et de celle sur les écoles de musique. Cette étude débouche en tout sur seize outils grâce auxquels le personnel peut embrasser (presque) d’un seul regard l’ensemble de notre travail. Alliant vulgarisation, précision et facilité d’utilisation, ils proposent nombre d’ouvertures permettant au COV d’entamer un processus d’amélioration de la gestion documentaire. L’imagination et l’ordonnancement sont au coeur des tâches menées ici, dont la nature ressemble à celle d’autres tâches des professionnels de l’information documentaire. Les gestionnaires de l’information doivent souvent allier créativité et structuration

    Improving average ranking precision in user searches for biomedical research datasets

    Full text link
    Availability of research datasets is keystone for health and life science study reproducibility and scientific progress. Due to the heterogeneity and complexity of these data, a main challenge to be overcome by research data management systems is to provide users with the best answers for their search queries. In the context of the 2016 bioCADDIE Dataset Retrieval Challenge, we investigate a novel ranking pipeline to improve the search of datasets used in biomedical experiments. Our system comprises a query expansion model based on word embeddings, a similarity measure algorithm that takes into consideration the relevance of the query terms, and a dataset categorisation method that boosts the rank of datasets matching query constraints. The system was evaluated using a corpus with 800k datasets and 21 annotated user queries. Our system provides competitive results when compared to the other challenge participants. In the official run, it achieved the highest infAP among the participants, being +22.3% higher than the median infAP of the participant's best submissions. Overall, it is ranked at top 2 if an aggregated metric using the best official measures per participant is considered. The query expansion method showed positive impact on the system's performance increasing our baseline up to +5.0% and +3.4% for the infAP and infNDCG metrics, respectively. Our similarity measure algorithm seems to be robust, in particular compared to Divergence From Randomness framework, having smaller performance variations under different training conditions. Finally, the result categorization did not have significant impact on the system's performance. We believe that our solution could be used to enhance biomedical dataset management systems. In particular, the use of data driven query expansion methods could be an alternative to the complexity of biomedical terminologies
    • …
    corecore